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Résumé 

On cherche ici à quantifier la convergence à l'équilibre de processus 
de Markov non réversibles, en particulier en temps court. La simplicité 
des modèles considérés nous permet de donner une expression assez ex- 
plicite de l'évolution temporelle de l'erreur L 2 en norme opérateur et de 
la comparer avec celle des cas réversibles correspondants. 
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1 Introduction : un processus de volte-face 



Le recours à la réversibilité peut parfois limiter les performances des algo- 
rithmes stochastiques (voir par exemple [3, 8, 4J), ce qui nous motive à mieux 
comprendre la convergence vers l'équilibre des processus non-réversibles. Dans 
ce papier nous étudierons en détail un modèle, pour lequel on verra comment se 
quantifie le fait que les processus non-réversibles ont d'abord tendance à aller 
moins vite à l'équilibre que leur équivalent réversibles, avant d'atteindre des 
taux asymptotiques de convergence bien meilleurs. On retrouvera notamment 
pour une chaîne de Markov en temps discret et à espace d'état fini (étudiée 
dans [1] d'un point de vue asymptotique) les phénomènes d'amorce lente de 
convergence mis en évidence dans [7J, dans un contexte continu d'équations 
d'évolutions cinétiques simples. 

Plus précisément, soit (Pt)t>o un semi-groupe markovien admettant une 
probabilité invariante /i. Sous des conditions d'ergodicité, Pt converge, en divers 
sens, vers /j, pour de grands temps t > 0. Considérons la convergence forte dans 
I/ 2 (/x) : en interprétant /i comme l'opérateur /•—>(/ fdfj,)!., on s'intéresse à la 
norme opérateur \\Pt — dans L 2 (/j,). 

Sous hypothèse de réversibilité, le générateur C du semi-groupe se diagonalise 
dans une base orthonormée (ou plus généralement, relativement à une résolution 
de l'identité formée d'une famille monotone de projections), ce qui permet de 
voir que 

Vi>0, \\Pt-n\\ = exp(-Àt) 

où —A < est la borne supérieure du spectre de £\i±, la restriction de £ à 
l'espace orthogonal aux fonctions constantes dans L 2 {^) (s'il est non nul, À est 
appelé le trou spectral de C). 

Dans les cas non-réversibles, il peut en être autrement, même si la fonction 
R+ 3 tu- ||P t — A*ll est toujours décroissante (il s'agit d'une conséquence de 
l'inégalité de Jensen). Ainsi dans [7J, pour la diffusion constituée du couple 
d'un processus d'Ornstein-Uhlenbeck linéaire et de son intégrale sur le cercle, la 
décroissance de ln(||P t — n\\) pour t > petit commence par être d'ordre t 3 . 

Pour mieux appréhender ce phénomène, on va s'intéresser ici à un modèle 
très simple, analogue en temps continu de la marche persistante d'ordre 2 de 
[1] : une particule se déplaçant à vitesse constante sur un cercle et faisant brus- 
quement volte-face à taux constant. Autrement dit, on considère (Yt)t>o un 
processus sur {—1, 1} qui change de signe avec un taux exponentiel a > 0, et on 
pose pour tout t > 0, X t := f Q Y(s)ds sur T = R/27rZ, de sorte que (X t ,Y t ) re- 
présente le couple position- vitesse de la particule au temps t > 0. Ce modèle est 
cité comme exemple simple d'hypocoercivité dans [5]. Le processus (A t ,Yi) t >o 
est caractérisé par son générateur infinitésimal, qui agit sur des fonctions tests 
convenables / par 

V (x, y) e T x {-1, 1}, C a f(x, y) := yd x f(x, y) + a (f(x, -y) - f(x, y)) 
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ou par le semi-groupe (P t a ) t >o qu'il engendre sur L 2 (iï) : pour tout / G £ 2 (/j), 

V t > 0, V (x, y) e T x {-1, 1}, P t a f(x, y) := E (/(X t , y t )| Jf = i, Yo = y) ■ 

La mesure invariante fi correspondante est la loi uniforme sur T x { — 1,1}. 
Il est connu que P t (pour alléger les notations, le paramètre a > sera souvent 
sous-entendu) converge fortement dans L 2 (/i) vers fi et que la vitesse finit par 
être exponentielle (voir la section 1.4 de [5], bien que le taux optimal n'y soit 
pas obtenu). Comme ce serait le cas pour des opérateurs de dimension finie, on 
suspecte que 



lim ~log||P t -/i|| 

t->+oo t 



-X 



avec 



A 



inf{— 6 valeur propre de 



(1) 



(2) 



On va vérifier que ceci est juste, mais on cherche surtout des résultats plus 
quantitatifs, en estimant précisément la norme \\P t — en tout temps t > 0, 
car en pratique des renseignements asymptotiques tels que ((T]) ne sont pas très 
exploitables. Voilà l'essentiel des résultats obtenus (illustrés par les figures ??, 
?? et ??) sur ce modèle : 



Théorème 1. Pour a > 1, on a A = a — \J a? — 1 et pour a < 1, A = a. Plus 
précisément, pour tout t > 0, 

- Si a > 1 alors, en notant u> — y/ a 2 — 1 et 7 = e~ 2ut , 

\\P t -H\\ = e^+V^ï)* 



\ 



1 



= 1 — — + o {t à ) 
3 t^o v 



(sW i+ " 2 (^)" 



a 2 - 1 

SV' a = 1 afors 

ll« -Mil 



\ 



1 + 



t— >+oo 



2te" 
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Si a < 1 alors 



I^-mII 



nt 3 



avec g telle que 



limsup g(t) 

t— »+oo 



1 + a 
1-a 



liminf g(t) = 1 

t— >+oo 



et, en notant v — 2\/l — a 2 , si t € [0, — 1 alors 



g(t) = h 



Comme dans [7] , on observe une décroissance initiale en t 3 . Dans ce contexte 
non-réversible, la norme opérateur \\P t — /j,\\ se comporte donc différemment du 
rayon spectral de Pt — /i, qui n'est autre que exp(— At), avec A défini en @. 
Comme nous l'a fait remarquer le référée, ceci traduit aussi l'aspect anormal 
des opérateurs Pt, pour t > 0. Par ailleurs, le choix optimal de a (au sens du 
meilleur taux asymptotique de convergence exponentielle) correspond à a = 1 
et voit le facteur pré-exponentiel exploser linéairement en temps grand. 

Le processus (X t ,Y t )t>o précédent est un exemple de processus de Markov 
déterministe par morceaux, famille de plus en plus étudiée dans la littérature, 
notamment pour ce qui concerne les processus de type TCP (voir par exemple 
les articles [UH] et les références qu'ils contiennent). Actuellement les méthodes 
de couplage semblent les plus efficaces pour étudier leur convergence, au sens 
de la distance de Wasserstein ou de la variation totale. Pourtant nous nous 
demandons si l'un au moins de ces processus, la version du TCP à taux de saut 
constant, ne pourrait pas être étudié par le biais d'une variante de l'approche 
spectrale que nous allons suivre dans ce papier. En effet, il s'agit du processus 
sur R + dont le générateur C agit sur des fonctions tests / par 

VxeM+, Cf(x) := f'(x) + l(f(rx)-f(x)), 

où l > et r E (0, 1) sont des constantes. Même si la probabilité invariante 
associée \x est difficile à décrire explicitement, ses moments se calculent immé- 
diatement (en faisant agir C sur les monômes) . La diagonalisation de C est facile 
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à obtenir, car les vecteurs propres sont des polynômes. On en déduit également 
une formule pour leurs produits scalaires. On dispose donc de toute l'infor- 
mation spectrale nécessaire théoriquement pour calculer les normes opérateurs. 
Malheureusement nous n'avons toujours pas réussi à mener à bien les calculs. 
Une autre caractéristique spectrale curieuse de C est que bien que son spectre 
soit formé de valeurs propres de multiplicité 1 et bornées par l, C n'est pas borné 
en tant qu'opérateur dans L 2 (ii), du fait de sa composante différentielle. 

Le théorème Q] sera démontré au cours de la partie [2] La partie [3] s'attache 
au lien entre le modèle discret de la marche persistante et son analogue continu 
du volte-face. Lorsque la fréquence de changement de vitesse devient grande ce 
processus continu tend vers le mouvement brownien, ce qui est étudié en partieUJ 
La partieOquant à elle discute des généralisations de ces premiers résultats à des 
potentiels quelconques et à la dimension supérieure. Enfin, l'appendice regroupe 
quelques lemmes techniques utilisés dans le reste du texte. 

2 Calcul exact de la norme 

Remarquons une fois encore que si le processus était réversible, le travail se- 
rait simple puisque C a serait diagonalisable en base orthonormée (dans L 2 (/i)). 
Ce n'est pas le cas ici mais on va tout de même pouvoir décomposer l'espace en 
plans stables orthogonaux ce qui nous ramènera à calculer des normes d'opéra- 
teurs en dimension 2, qu'il faudra ensuite comparer entre elles. 

Lemme 2. Les plans V n = {/ : (x, y) H> e mx g(y), g S C^" 1,1 ^}, pour n € Z, 
sont invariants par C a , orthogonaux et totaux dans L 2 [pi) . L 'action de P É a sur 
V n est donnée par e tK ™ ' , où pour toute fonction test g, 

Vye{±l}, K^g{y) := inyg(y) + a(g(-y) - g(y)) 

(à l'instar du générateur et du semi-groupe, le paramètre a sera généralement 
omis par la suite). 

Démonstration. L'orthogonalité et le caractère total découlent directement de 
ceux de (x H> e mx ) n(E N dans L 2 (T). On s'assure ensuite directement que pour 
f(x,y) = e mx g(y) on a bel et bien Cf(x,y) = e mx K n g(y). □ 

On est donc ramené à calculer la norme d'une matrice 2x2. Notons 

R(t,a,n) d ^ \\P t a -»\\ 2 Vn . 

Notons que pour tout n ^ on a V n C Ker(pL). Le cas n — est un peu à part 
et facile à régler : K est diagonalisable avec deux valeurs propres, (associées 
aux constantes, que l'on retranche ici) et —2a. Ainsi 

R(t,a,0) = e~ iat . 
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Cette restriction ne réalisera en fait jamais la norme globale (sauf t = bien 
sûr) : en effet on va voir que, quelque soit a, L possède des valeurs propres 
de parties réelles —a; ainsi sur une droite propre pour une telle valeur propre 
\\Pt\\ = e~ at > e~ 2at . D'autre part K n = K- n et on se restreindra donc dans la 
suite à n > 0. Finalement, 

\\P t - m || = sup(||Pt||v n ) = sup (y/R(t,a,n)) 

n>l n>l v ' 

Calcul des normes des restrictions 
Lemme 3. Si a > n alors pour tout t > 

/ 

R(t,a,n) = e -2(a-V5»=H»)t x 1 + 



avec u 



{ « a (^)+sv i+wa (^) -v 



Démonstration. Les deux valeurs propres de K n , réelles, sont Ai = — a + nuj > 
A 2 = — a — nui. On calcule que (ei, e 2 ) sont des vecteurs propres correspondants 
unitaires ils vérifient | < ei,e 2 > \ = ^ (les vecteurs propres sont « d'autant 
plus orthogonaux » que a est loin de n), on peut donc choisir (ei, e 2 ) unitaires 
tels que < ei, e 2 >= -. En posant m = re l9 ei + e 2 on a ainsi 



e tK " U = re îf, e Al *ei+e A2t e 2 
||u|| 2 = r 2 + f + 2r- cos(6>) 

, e tJf B -A 1 * u ||2 = r 2 + 7 2 + 2r7 " COS (0) 

a 

= IM! 2 + (7-l) x [7+l + 2r-cos( 



a 



En conséquence 



e tK n -x ltu p r 2 + 7 2 + 2n !i cos (él) 

H 1 " r 2 + f + 2r^ cos(0) 

r 2 + 7 2 — 7r 2 - 7 

= 7 + 



r 2 + 1 + 2r^ cos(0) 

quantité qui, à r fixé, est monotone en cos(0). Les valeurs extrémales sont donc 
obtenues avec cos(#) = f (quitte à prendre r < 0). On a alors 
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1 h ii 2 = l + (7-l)x 



2 + 1 + 2r^ 



r 



( r + ïF + i-(ï) 2 



D'après le lemme[T31 les valeurs extrêmales sont 



\e tK ^uf = 1 (i) 2 (!-7) 



ni 2 (!f-m±^r-7(!) 

Le maximum est obtenu pour ± = — , et l'on obtient 




R(t, a, n) 



a 1 2(l-cos{v n t)) 



1 - 1 



avec v n = 2\prv L 



Démonstration. Dans ce cas les valeurs propres de K n sont complexes conju- 
guées, Ai = À2 = A = — a + i^/n 2 — a 2 , de partie réelle a. On trouve des vecteurs 
propres normés associés e\ et e-i vérifiant < ei,e2 >= — (là encore le produit 
scalaire des vecteurs propres tend vers à mesure que a et n s'éloignent). 

Posons u = e\ + re %0 e% avec r G M et e] — tt,tt]. On a alors e tKn u = 

e xt (ex + re l0 e- 2Wn '*- a ' J e 2 ), et ainsi 



u 



2 J2 



a 



r z + 1 + 2r- cos(0) 



n 



|i e tJf„-tA u ||2 = r 2 + ! + 2r ~ cos(<9 - 2ty/n 2 - a 2 ) 

n 

Par le lemmc Q3] on obtient que le rapport entre les deux est extrémal pour 
r = ±1, on est donc ramené à 
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m tK n -t\\\2 _ „„„ a n + COS(g ~ V n t) 
c , | — oUp . . 

e eT a n + cos{u) 

avec a„ = — > 1. Le lemme [Tïïl de l'appendice conclut. □ 
Lemme 5. Si a = n alors pour tout t > 

R{t,a,n) = e~ 2at x 1 + 



Démonstration. Dans ce cas — n est valeur propre double de K n . Considérons la 
base gi(y) = 1 + iy et «72 (y) = ^ de C^ _1:1 ^. La matrice de K n dans cette base 

est alors un bloc de Jordan, d'exponentielle e~ nt \ \\. En renormalisant g\ 



et g2, on obtient des vecteurs de base unitaires e± et e 2 avec < ei,e2 >= ^7=, 
e tif "ei = e~™*ei et e tKn ei — e~ nt (e.2 + \f2nte\). En posant u = (x + iy)ei + e 2 , 



on a ainsi 



e tK »u = e - nt (u + Vïntex) 
\\u\\ 2 = x 2 +y 2 + l + V2x 



tK ^u\\ 2 = \\u\\ 2 + 2n 2 t 2 + 2V2nt(x+^= 



Le rapport W — n— m — — est donc optimal pour y ~ 0. Reste à choisir x. 



I tif„+nt 112 X + 4= + ^ 

16 „ = l + 2V2nix- f-^ 



D'après le lemme [Ml les valeurs extrêmales sont 



\e tK "+ nt u\\ 2 , /- 

- = l + V2nÉx 



m|| 2 rat j_ /" 2 t 2 1 ! 



1,1 V 2 ^ 2 

et le maximum est obtenu pour ± = +, ce qui donne le résultat escompté. □ 
Remarquons qu'on aurait pu obtenir ce résultat par continuité à partir des 
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Comparaison des R(t, a, n) 

Il s'agit maintenant de comparer les normes de ces restrictions entre elles. 
Un développement limité en t = montre que R(t, a, n) = 1 — ^t 3 + o(t 3 ) pour 

a > n et R(t, a, ri) = 1 — ^j-t 3 + o(t 3 ) pour a < n, ce qui laisse penser qu'au 
moins au début R(t, et, 1) prévaut (autrement dit que l'erreur décroit lentement 
sur V\ les fonctions de grande longueur d'onde en x). D'autre part, si a > 1, 
c'est aussi sur V\ que se trouve la droite propre associée à la valeur propre 
de C de plus grande partie réelle, c'est donc également R(t, a, 1) qui devrait 
prévaloir asymptotiquement. En fait nous allons voir que, pour l'essentiel, seule 
compte cette norme sur V\. Notons que les expressions calculés pour R(t,a,n) 
permettent d'étendre leur définition à n non entier et qu'alors n ë]0,+oo[ i— > 
R(t, a, n) est continue. 

Dans un premier temps, on peut dériver R(t, a, n) pour n €]0, a[. Le lemme 
1171 de l'annexe montre que cette dérivée est négative et ainsi max R(t, a, n) = 

l<n<a 

R(t, a, 1) pour tout t > 0. Par continuité on a même max R{t, a, ri) = R(t, a, 1). 

l<n<a 

Ainsi a-t-on réglé les cas a > 1 du théorème [TJ puisqu'alors \\P t — = 
maxiï(i, a, n) = R(t, a, 1). 



Le cas des n > a est un peu plus délicat, pour qui 
avec, si v n = 2\/ ri 2 — a 2 



R(t,a 1 n) = e- ta y^Jt) 



9n(t) = 1 + 



a? 2(l-cos(i;„t)) 



qui est 2-n/v n périodique. Calculer le supremum des g n pour tout t est à peu près 
impossible du fait des périodes incommensurables (cf. figure ??). Cependant on 
peut penser (d'après le développement limité en 0) qu'en temps petit la norme 
prépondérante correspond à n minimal et qu'elle le reste jusqu'à ce que g n 
atteigne son maximum. C'est effectivement le cas, comme on va le montrer dans 
un instant. Ensuite le suprémum des oscillera entre ce maximum et 1. 



Lemme 6. Si k < n alors pour tout t G 
Démonstration. 



o,— 



on a g k (t) > g n {t). 



2 

9n(t)<g k (t) ^ 1 + . <i + 



i I 1 1 / "fc i 11] 

ïï T 2(l-cos(i/„t)) ^ -L y ^(l-cosK*)) ~T 1 1 



1 — cos(^„i) 1 — cos(vkt) 

^ 2 — 2 
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Ces deux termes sont égaux et de dérivées égales en t — 0, pour les comparer 
il suffit donc de comparer leurs dérivées secondes. Or, si v n > x/% alors co%(y n ï) < 

cos(î/fci) pour t G 0,-jj- , et donc g n (t) < gk{t) pour ces t. Puisque g^ est 



croissante sur 



0,-=- 



on a pour t G 



7T 7T 



7T 7T 
5fcW > 9k( — ) > 9n[ — ) > 9n(t). 



On achève en constatant que v n est croissante en n. □ 

Lemme 7. Si n > a alors pour tout t > on a R(t, a, n) < R(t, a, a). 

Démonstration. D'après le lemme précédent, pour tout s > on a R(t, a, n) < 
R(t, a, a + e) pour t < ; or v a+e — > et la continuité de R conclut. □ 

En particulier si a > 1 pour tout t on aura \\Pt — = R(t,a, 1), ce qui 
démontre les deux tiers du théorème [T] Pour a < 1 on peut comparer plus 
finement les g n : 

Lemme 8. Soit g(t) = supg n (t). Si t < — alors g(t) — g\{t), et d'autre part 

limsup.g(t) = (=supg) 
t-î-+oo 1 — a 

liminf g(t) = 1 (=inf<7) 

t— >+oo 

Démonstration. La première assertion a déjà été démontrée, et le résultat pour 
la limite supérieure découle directement de la périodicité de g\. Pour la limite 
inf, considérons e > 0, et soit iV G N tel que , ff < 1 + e. On a ainsi, pour 

1 N 

tout /c > N et pour tout t > 0, gk(t) < 1 + e. On cherche ensuite un temps 
où les fonctions restantes (en nombre fini) sont simultanément proches de leur 
minimum. Fixons S > tel que pour tout n < N et tout k G Z, on ait 

2kir 

\t 1 <ô^g n (t) <l + s. 

v n 

Le lemme [Tïïl de l'appendice nous fournit t > 1 et des entiers fci, . . . , k^-\ E N 
tels que \^ L k n — t\ < S pour tout ?i < N ; on obtient que g n {t) < 1 + e pour 
tout n < TV, et donc pour tout n G N. Soit £o le minimum sur [1/2, t + 1] de 
g — 1 (fonction continue). Si £o — alors 5 est périodique et son minimum 
est sa limite inférieure. Sinon on peut recommencer l'argument ci-dessus pour 
obtenir un temps £2 > 1 tel que pour tout n G N on ait g n {t2) < 1 + £o/2, 
donc nécessairement £2 > t + 1 ; finalement en itérant le procédé on peut trouver 
des temps arbitrairement grand où g est arbitrairement proche de 1, ce qui 
conclut. □ 

Ce lemme finit de démontrer le théorème [T] 
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3 Du discret au continu 



L'étude du volte-face a initialement été motivée par celle de la marche consi- 
dérée dans [1] : Y n est une chaîne de Markov sur { — 1, +1} qui change de signe 
avec probabilité (1 — ct)/2, et X^ +1 — X^ + Y n dans Z/7VZ =: Zjv, avec 
N G N \ {0,1}. Ainsi pour son n lcmo saut la particule (dont la position est 

) persiste dans le même sens qu'au coup précédent avec une probabilité su- 
périeure à 1/2, c'est bien l'analogue discret du processus continu des sections 
précédentes. Notons que la chaîne (X^) n ^ est markovienne d'ordre 2. 

Pour peu que N soit impair la chaîne est irréductible apériodique et converge 
donc en loi vers son unique probabilité invariante fijy, qui est la mesure uniforme 
sur Zn x {±1}. L'opérateur M a f(x,y) = E(f(Xi,Yi)\Xo = x,Y = y) associé 
agit sur les fonctions de L 2 (/ijv) et la norme d'opérateur IIM"— /xjv|U 2 ('u w ') — > 

(en voyant à nouveau [i^ comme l'opérateur />->•(/ fdfij^)!-). On a même 

lim -ïog(\\M^-fx N \\) = ïog(\ a ) 
n— >+oa n 

où, en notant cr(M a ) le spectre de M a , \ a = sup(|cr(Af Q ) \ {1}|). Ce taux 
exponentiel de convergence log(A Q ) est de valeur absolue maximale (et donc de 
vitesse asymptotique la meilleure) pour a op t — 1+ si'n(^/jvj » P our lequel X opt — 
■Joiopt (cf. [!])■ En comparaison, pour la marche isotrope [a = 0), on a Ao = 
cos(it/N). On a donc amélioré la convergence en temps long car 



cos(tt/A0 = V(l-sin(VA0)(l + sin(VA0) > ]J \ + g^fj ■ 

L'étude du volte-face a permis de mieux comprendre l'amorce de convergence 
en temps petit, et nous pouvons maintenant faire le lien avec la marche discrète. 
D'abord constatons que des calculs identiques aux précédents nous permettent 
de calculer la norme de M. Pour fc G [1, N\ on notera e 2ik */ N = C k + iS k , 

n, — 1 ~I S 'I r 2 — 4a oi <? 2 — f 2 



1+|S,|' — (Ï+SF — 

Lemme 9. Les plans Wk — {(x, y) i— > e 2lk7TX / N g(y), g G C ±:L } sont stables par 
M. Notons R N {n, a, k) d = ||M™ - . 
- si a < ctk alors 



R N {n,a,k) = Al" x 




v + - 2 (^) + # + - 2 (^) 2 - 1 y 

^-fe)"e^ 2 -(f) 2 -l 
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si a > a>k alors 



i?Ar(n, a, k) — a n x 



où tain; = w ( ^ ) - 1. 
si enfin a = ctk alors 



'l-cos(2nV) / 



Rn(ti, a, k) 



a x 



1 



- 1 



Démonstration. La démarche et les calculs sont quasiment les mêmes que dans 
le cas continu et n'amènent aucune difficulté nouvelle. □ 

Lorsqu'on veut passer du modèle discret au continu, plutôt que € %n 



il vaut mieux regarder — 



2tt v 



N 



e T si t 



' N 



que l'on prolonge de façon 



affine à t > et V t N = Y n si t g ^ [n, n + 1 [. Si la probabilité de changer de sens 
1 ~^ tJV est de l'ordre de -h , la convergence des temps entre deux changements vers 
une loi exponentielle donne la convergence en loi de (U N , V ) vers le processus 



continu. Remarquons que pour u = jj-x on peut réécrire e 
14 correspond donc à Wk '■ 

si a W 



e 1 , l'espace 



Lemme 10. Pour tout t > et k G 



G [0,1] est tel que 



N 



JV-S-+00 



a alors 



R 



N 



Nt 
2^ 



, a 



JV-S-+OC 



R(t, a, k). 



Démonstration. On le vérifie sans difficulté particulière sur les expressions ana- 
lytique données dans le lemme [9] et la partie [2 □ 

Cependant, contrairement au cas continu, dans la marche discrète la plus 
grande valeur propre (associée au | cos(2^)| maximal) ne correspond pas à k = 1 
mais à k = ± [^J . Pour avoir la convergence des normes globales d'opérateurs 
il faut ignorer les deux plans W ± ^ n j . En un sens le caractère fini des positions 
prises par la particule entraîne l'existence d'observables qui convergent mal, ce 
qui disparaît à la limite des processus, mais pas dans le passage à la limite des 
normes. 



Lemme 11. Pour tout t > et k e Z, si 

1 ~" < ' — > a alors 



G [0,1] est tel que £ 



N-ï+oo 



R 



N 



Nt 
2^ 



N 
~2 



W->+oo 



R 



t,a,k+- 
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Démonstration. Les calculs sont les mêmes que précédemment ; le 1/2 apparaît 
avec 




Le travail de comparaison des R(t, a, n) englobait déjà les n non-entiers, et 
en notant pour tout t > 0, 

V^Z w ,Vi;6{±l}, P t N f(u,v) := E(f(X^Y n N )\X?=u,Y N = v) 
avec n = |_7Vi/(27r)J , on obtient in fine 

Théorème 12. Si g- x 1 ~" <iV> — > a > ± afors 

N— S-+OC \^ ^/ 

D'autre part si Von note Vjv •= Vect(W^ijv/2| , W^-|jV72j) e ^ si a > 1 aZors 

\\P t N -»Nh N v — > ll^-Mll- 

TV— >-+oo 

Les convergences sont uniformes en t. 



Démonstration. Tout est déjà démontré sauf le caractère uniforme en t ; les fonc- 
tions en présence étant toutes décroissantes et les limites continues, il découle 
du théorème de Dini. □ 

Remarque. Notons que, grosso modo, les choses se passent bien également pour 
a < | dans le premier cas et pour a < 1 dans le second mais avec de très légères 
subtilités : par exemple, dans le deuxième cas et pour reprendre les notations 
de la partie [H la fonction g(t) limite n'est pas le supremum des g n (t) pour n 
entier mais pour n entier ou demi-entier, ce qui peut éventuellement légèrement 
changer la valeur exacte de la norme lors d'un « creux » de R(t, a, 1). 

Un constat particulier sur ce défaut de convergence du discret vers le continu 
est que si l'on prend pour tout N la probabilité optimale (au sens du trou spec- 
tral maximal) de changer de sens dans la marche persistante, alors on converge 
vers un taux 1/2 de saut pour Y t , qui n'est pas optimal pour le processus continu, 
et qui donne le même taux exponentiel 1/2 de convergence que le mouvement 
brownien sur le tore. 

Cependant le phénomène de décroissance initiale en t , lui, n'est pas affecté 
par cette subtilité ; c'est normal car son origine n'est pas dans la prise du supre- 
mum des normes des restrictions mais, déjà localement, sur chacun des plans Wk- 
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Une interprétation possible est que prendre, au lieu d'un processus réversible, 
l'intégrale d'un processus réversible retarde initialement l'effet de mélange du 
hasard ; ou bien que la particule commence par se déplacer de façon déterministe 
et brouille donc moins bien les pistes qu'une diffusion au moins initialement. 

Si pour N grand, on compare (en oubliant le défaut de convergence et les 
fonctions de Vect(W|_j\r/2j , W-ijv/2j)) la marche simple et la marche persistante 
pour a = 1 à la limite, pour un nombre n d'itérations fixé, l'écart L 2 à l'équilibre 
de la marche réversible est environ 1 — | avec t = n (^) (si cette quantité est 
petite) et celle de la marche persistante est 1 — y avec t = n^- (si n -C N), qui 
devient meilleure que la précédente pour n « J j^N (qui assure aussi la validité 

des asymptotiques précédentes) : c'est le nombre d'itérations à partir duquel la 
marche d'ordre 2 est plus proche de la mesure uniforme que la réversible. 

4 Du continu au mouvement brownien 

Lorsque a — > +oo, la vitesse du processus continu saute de plus en plus vite 
de —1 en 1 ; à la limite, les vitesses en deux temps distincts devraient donc 
être décorrelées. Le processus devrait en conséquence être l'intégrale d'un bruit 
blanc, autrement dit un mouvement brownien. Avec la bonne renormalisation, 
c'est effectivement le cas : 



Théorème 13. X a = (Xt a )t>o converge en loi vers un mouvement brownien 
standard sur T quand a — > +oo. 



Démonstration. Notons Y t — (— 1)^' où N t est un processus de de Poisson de 
paramètre 1. Ainsi X suit la même loi que J Q Y as ds 

r-ta 

X a (t) = / Y as ds 
Jo 

4. 2 

1 

a 

ce qui nous ramène à l'exemple 3 p. 360 de [B] où l'on nous indique la marche à 
suivre. 

Détaillons : on montre d'abord que M(t) =Y t + 2 J c \Y u du est une martingale. 
En effet le nombre de changement de signes de Y t dans une période t — s suit 
une loi de Poisson de paramètre t — s, et ainsi 
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F(Y t = Y.) = J2 ^ ^ e ~ (t ~ S) = cosh(t ~ s ) e_(t " s) 

k pair 

(t-s_Y 

k\ 



kl 

P(Y t = -Y s ) = Y, {t ~J r e " (t " S) = sinh(t - 5 )e' (t ° 



A; impair 

Ainsi E(y t |7" a ) = F s e- 2 (*- s ) et 

E(M(i)|JF a ) = y s e- 2( '- s) + 2 / y u du + 2 / ^e^'^^du 



= y + 2 / y u du 

= M(s) 

Si l'on montre la convergence de la martingale -^M(n 2 t) = 2A" + ^Y t vers 
le brownien, on aura celle de X n ; or la première s'obtient de la convergence 
des crochets. La variation quadratique de f* Y u du, processus 1-lipschitzien, est 
nulle, donc 

<M> t =i4^(y i+1 -y ti ) 2 

où la limite en proba a lieu lorsque le pas S de la partition tt de [0, t] tend vers 
0. Notons Zt le nombre de saut de Y sur cet intervalle. 



P(^ (y ii+1 - Y u f ^ AZ t ) < P(deux sauts sont distants de moins de S) 

-> 

Ainsi < M > t = AZ t , et < -M(n 2 .) > t = AZ n 2 t — > 4t (par la loi des 

71 n n— >+oo 

grands nombres), ce qui donne la convergence de ±±M(n 2 t) (et donc de X?) 
vers le mouvement brownien standard (cf [3]). □ 



Qu'en cst-il de la norme? Celle du modèle irréversible converge-t-elle vers 
celle du brownien? C'est effectivement le cas. Le générateur du mouvement 
brownien est \d 2 , diagonalisable dans la base orthonormée des x h-» e mx pour 
les valeurs propres —\- Rappelons la norme du semi-groupe associé à (X t , Y t ) 
sur le plan V n , quand a > n : 
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avec Ai = —a + Va 2 — n 2 , u> = y/a 2 — n 2 et 7 = e - 2t Va?-n? _ On observe que 
aAi — >■ — ^ra 2 , lu — > +00 et que 7" — > quand a -4- +00 ; Au final, en notant P t ° 
le semi-groupe associé à (A at , Y" at ), on récupère 

ll^lk -> e-^" 2t , 

a— >+oo 

ce qui est la norme du semi-groupe Q t associé au mouvement brownien sur 
la droite Vect{a; i-> e mx }. En particulier la convergence pour n — 1 donne la 
convergence de la norme globale ||P t a — fi\\ — > \\Q t — A||. 



5 Généralisations 

5.1 Avec un potentiel général 

En fait le cas précédent, où la mesure invariante pour X t est la loi uniforme 
sur le cercle, est immédiatement généralisablc à des processus admettant pour 
loi limite n'importe quelle mesure de la forme v = e~ v ^dx/(2-n), où le potentiel 
V est supposé normalisé de sorte que v(T) = 1. En effet, considérons comme 
précédemment Y t G { — 1, 1} qui, avec taux a, change de signe. Soit X t € T la 
solution de 

dX t = Y t e v(Xt ^dt. (3) 

Autrement dit X t représente la position d'une particule se déplaçant à vitesse 
(déterministe) inversement proportionnelle à la densité e^ v ^ (les zones « peu 
intéressantes > sont parcourues plus vite) et changeant de sens de parcours selon 
des temps exponentiels . Montrons qu'alors la mesure invariante pour (X t , Y t ) est 
/U = v®U{-i t \y, et que la norme 2 du semi-groupe associé se calcule exactement 
comme précédemment. Le générateur markovien associé au processus est 

Cf(x, y) = e v ^ydj(x, y) + a (f(x, -y) - f(x, y)) 

Et l'on vérifie 

v®U{-±^[Cf(x,y)\ 

= 11 [e Vix) yd x f(x,y) + a(f(x,-y)-f(x,y))}e- v ^dxd y 

JxeT Jy=± 

= y{ d x f{x,y)dx ) dy 

Jy=± \JxeT J 

= 0. 

Considérons pour n € N, g n {x) = exp (in e~ v ( u ^du^ (on a bien g n (0) — 
g„(27r) de par la normalisation de V) et des fonctions de la forme f(x,y) = 
g n (x)h(y). On a alors 
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£f(x,y) = 9n(x)[inyh(y) + a(h(-y) - h(y)] 

= g n (x)K^h(y) (4) 

où a été défini dans le lemme [2] pour le cas uniforme. On parvient donc là 
encore à décomposer l'espace en plans stables V n , et ces plans sont à nouveau 
orthogonaux entre eux dans £ 2 (/i) : 



<9n,gk>m f ,) = J q exp(i(n-k)J e v{u) du^je v{x) dx 

27T 







fc 



Finalement, si PY est le semi-groupe associé au processus (et Pt est toujours 
celui associé au potentiel nul), on a exactement 

\\ p ï - = - A®w { _i,i}|| i 2 (Al8M{ _ 1 1}) 

D'après la section 1, le meilleur taux de convergence asymptotique est donc 
obtenu en choisissant a = 1. Remarquons que lorsque V n'est connu qu'à une 
constante additive près et que l'on veut garder le bénéfice de l'écriture ([3|), il 
faut modifier en conséquence la définition de v et des g n , pour n G N, et on doit 
remplacer Kn par Z~ 1 K^ lZ \ avec Z := e~ v ^ dx/(2w) dans (H]). Le choix 
optimal de a est alors Z^ 1 , qui malheureusement n'est pas connu en pratique. 



5.2 Remarque sur les dimensions supérieures 

Remarquons que, dans l'optique d'un algorithme de Monte-Carlo non ré- 
versible, les résultats s'adaptent à la dimension supérieure. Ainsi en définis- 
sant Y^,. .., Y t d et Xf, . . . , Xf comme précédemment, dans le cas où V(x) = 
^2Vi(xi), on construit un semi-groupe PY sur T d de mesure invariante /x pro- 
portionnelle à e~ v ^dx tgiUfz-L 1 j et de norme 

d 

\\PY\\l 2 (v) = Yl\\Pt ri \\L2(Z i e- v i( : °i'>dXi®U { _ lil} ) 
i=l 

où les Zi, i G [1, d], sont les constantes de normalisation. On aurait pu imaginer 
un autre processus, construit en gardant l'idée d'une particule dont la vitesse 
scalaire dépendrait de façon déterministe de la position mais dont la direction 
changerait aléatoirement à taux constant. Cela donnerait un générateur du type : 

Cf(x,y) = e v ^V x f(x,y).y + a [ (f(x,z)-f(x,y))dz 
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pour des fonctions tests / régulières. Ci-dessus les vitesses sont prises unifor- 
mément sur la sphère mais on aurait pu les choisir différemment sans que les 
remarques à suivre ne s'en trouvent modifiées. La mesure invariante est alors 
Ze~ v ( x ^dx <S> Lt$d, avec Z = Z\ ■ ■ ■ Zd, ce qui semble bien parti. Néanmoins, à 
part pour un potentiel nul, on ne va pas pouvoir se ramener à l'étude d'un opé- 
rateur sur les vitesses par la même méthode qu'avant, c'est-à-dire en trouvant 
des fonctions propres de la famille d'opérateurs K y : f[x) h- > e v ^V f(x).y sous 
la forme f(x) = e u ^ x \ qui permettaient jusqu'ici de se ramener à des opérateurs 
n'agissant que sur les vitesses. En effet on a alors 

Kyf(x) = e v ^f(x)Vu(x).y 

Il s'agirait donc de trouver une fonction u : M. d — » R de différentielle x i->- 
e~ v< < x \cidxi + c 2 dx 2 + • • • + Cddxd), avec ci, Cd des constantes. Or si d > 1, 
cette 1-formc linéaire n'est pas exacte (n'étant pas fermée), et un tel u ne 
saurait exister. En comparaison, pour le processus avec des coordonnées in- 
dépendantes du début de ce paragraphe, la 1-forme linéaire qui apparaît est 
x J2 e~ Vi ( Xi ^dxi, qui est bel et bien exacte. 



6 Appendice 



Lemme 14. Si f(R) = ^ + a fe avec b > 0, alors f admet ses valeurs extrémales 
en R± = a ± \/a? + b, et ces valeurs sont f(R±) = jlï^- 

Lemme 15. Si q(0) — a +Ç os ( e ~ s ) avec a > 1, alors 



2 

max g (6) = 1 



eeT " x / 2(c 2 -i) ,1-, 

V l-cos(a) ^ 1 1 

De plus ce maximum est majoré par ^zj, borne atteinte uniquement pour s = 

7T [271-]. 

Démonstration. Le premier lemme ne présente aucune difficulté. Pour le second, 
remarquons tout d'abord pour s — [2n] que g est alors constante égale à 1 et 
son max l'est également, le lemme est donc vrai dans ce cas. Supposons dans la 
suite que 1 — cos(s) ^ 0. Réécrivons maintenant 

a + cos(# + s) a(l — cos(s)) — sm(6) sin(s) 

Q\") = tth- — = cos(s) H — 

" y ' a + cos(6>) v ' a + cos(6>) 

g(9) étant continue périodique il suffit de déterminer ses points critiques. Or 
g' (9) = équivaut à 

= — cos(0) sin(s) (a + cos(#)) + sin(0) (a(l — cos(s)) — sin(0) sin(s)) 
= — sin(s) + sin(0) (a(l — cos(s)) — a cos(é>) sin(s), 



18 



équation affine dont les solutions sont 

cos(0)\ _ (-0\ /l-cos(«) 
v sin(6>) ) V / V sin ( s ) 

pour t £ M et où l'on note /3 = ^ . La condition cos 2 + sin 2 = 1 équivaut à 

1 — cos(s) 

qui admet nécessairement deux solutions réelles puisque g est périodique non 
constante donc possède au moins deux points critiques. Ces solutions sont don- 
nées par 



t(l - cos(s)) = i/3(l - cos(s)) + ^eyj 2(1 - cos(s)) - fi 2 sin 2 (s) 

où e = ±1. On obtient ainsi les valeurs extrêmales de g : 

a(l - cos(s)) - tsin 2 (s) 

a(6U = cos(s) + — — r -V z 

yv ; w a - p + t(l - cos(s)) 

a — tsin 2 (s) — /3cos(s) + i cos(s) — i cos^ s) 
a - f3 + t(l - cos(s)) 

a — /3cos(s) — i(l — cos(s)) 
a - /3 + i(l - cos(s)) 

a - |/3(1 + cos(s)) - |e -^2(1 - cos(s)) - /3 2 sin 2 (s) 
a - i/3(l + cos(s)) + |e V2(l - cos(s)) - /3 2 sin 2 (s) 

Puisque a > 1 > (3, on a a — |/3(1 + cos(s)) > et la valeur ci-dessus est 
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maximale pour s = 



— 1, et ainsi 



2 l+cos(s) 
2 



a _ p ( I±££SM) + ^(i^£(£) ) (l ^ 



9 /l+cos(s)\ , // l-cos(s) \ / o l+cos(s)\ / — 

a - (^^J +Y l^^J r 2 J ^2 _ i±£2£(£) 



+cos(s) 
2 



/ 9 l+cos(s) , / 1— cos(s) / 1— cos(s) 

V" 2 +V 2 V 2 

= I X ; 

a 2 _ l+cosÇs) _ / l-cos(s) / l-cos(s) 



V l-cos( S ) + 1 + 1 

/ 2(a 2 -l) , -, -, 

V l-cos(s) ^ 1 1 



/ 2(a 2 -l) , 1 , 
Y l-cos(s) "T 1 1 

□ 

Lemme 16. Considérons M g N*, Tj > 0, pour 1 < i < M, et (5 > donnés. 
Il existe t>l et des entiers k\, . . . , Um tels que pour tout 1 < i < M, 

\hTi -t\<5 

Démonstration. Considérons le réseau de R M+1 engendré par les (0, . . . , 0, T n , 
0, . . . , 0) (avec T n en n lcmc position) pour n < M et par (1,1,..., 1), de volume 
fondamental V le produit des T n . Ainsi, en considérant le pavé [— ô, ô] x • • • x 
[—5, S] x [— Vô~ M , V5~ M ], de volume V2 d , on sait par le théorème de Minkowski 
qu'il contient au moins un point du réseau autre que l'origine. Les M premières 
coordonnées de ce point sont de la forme h n T n + Hm+i avec hj G Z pour 
j G [1,M+ lj. Si (5 < min(Ti, . . . , Tm, 1) (et quitte à réduire S, nous supposons 
ceci satisfait), aucun de ces coefficients hj ne peut être nul, et nécessairement 
/iM+i est de signe opposé aux autres hj. 11 suffit donc de prendre k n — \h n \ et 
t = \h M +i\- □ 
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Lemme 17. Notons, pour s > et p e]0, 1[, 



W 1 _ p 2 l _ e -ps 



PHP) + y/hipY + Tr? 



1 



Alors pour tout s, p i— > 0(p) es£ croissante. 

En prenant p = *J 1 — (^) 2 et s — 2at on obtient en particulier que pour 
t > ef a > 0, n G]0, a[i— > iî(t, a, n) es< décroissante. 

Démonstration. Le calcul de la dérivée est effectué via Maple : 

h:=p->p/(l-p-2)*(l+exp(-s*p))/(l-exp(-s*p)) : 
phi :=p->exp(p*s)*(l+2/(p*h(p)+sqrt(h(p) "2+1/ (l-p~2) ) -1) ) : 
résultat := simplify(exp(-p*s)*dif f (phi(p) ,p)) : 

Le résultat est de la forme ( un terme)'" p^i) (e- p a -i) > n s'agit donc de vérifier que 
le numérateur est positif. A l'instruction 

solve (numérateur (p)=0,p) ; 

la réponse est 

-RootOf (_Z exp(_Z) + _Z + 2 - 2 exp(_Z))/s 

Autrement dit le numérateur s'annule en p si e p — |-^, équation dont la seule 
solution est p — : en effet, s'il y avait une autre solution p*, la dérivée de 
eî> 2Tp s ' annulerait entre et p* , or celle-ci est (2+zy ■ Ainsi I e numérateur est 
de signe constant pour p G]0, 1[ et <p est monotone. Les limites de en et 
1 sont respectivement 1 H , 2 et e s , dont l'égalité est équivalente à 

\/is- 2 +l— 1 

2e s — 2 — s 2 = 0, d'unique solution s — ; vu leurs équivalents pour s — > +oo 
on a donc </>(!) > 0(0) pour s > 0, donc (j) est croissante. 



□ 
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